La fragmentation dans les entrepôts de données : une approche basée sur les algorithmes génétiques
نویسندگان
چکیده
Résumé. La fragmentation horizontale est une technique d’optimisation non redondante de requêtes décisionnelles de type ROLAP. L’utilisation de cette technique dans les entrepôts de données représente un enjeu plus important que dans un contexte de bases de données traditionnelles. Cette importance est due au différents choix des tables (de dimensions ou des faits) à fragmenter. Dans le contexte des entrepôts, la fragmentation n’a un sens que si la table des faits est partitionnée en fonction des schémas de fragmentation des tables de dimensions. Mais ce type de fragmentation de la table des faits pourrait engendrer un nombre important de fragments qui rendrait le processus de maintenance très coûteux. Afin de réduire ce nombre ou le rendre contrôlable par l’administrateur de l’entrepôt, nous proposons l’utilisation d’un algorithme génétique. Ce dernier a pour but de sélectionner les tables de dimension à fragmenter pour (1) éviter l’explosion du nombre de fragments de la table des faits et (2) garantir une meilleure performance d’exécution des requêtes. Notre algorithme génétique est développé sous visual C et validé par une étude expérimentale en utilisant le banc d’essai APB-1 release II.
منابع مشابه
ParAdmin : Un Outil d'Assistance à l'Administration et Tuning d'un Entrepôt de Données
Résumé. Les entrepôts de données ont rendu les tâches d’administration et de tuning plus complexes que dans les bases de données traditionnelles. Cela est dû aux caractéristiques des entrepôts de données : la volumétrie, les requêtes complexes, les délais de réponse exigés par les décideurs et la gestion de l’évolution. Dans ce contexte, une panoplie de techniques d’optimisation ont été proposé...
متن کاملUne approche de répartition des données d'un entrepôt basée sur l'optimisation par essaim particulaire
Résumé. Dans le contexte des entrepôts de données, le partitionnement des tables, des index et des vues matérialisées en fragments stockés et consultés séparément apporte des améliorations considérables en terme de gestion des données et de coût de traitement. Lors de leurs conceptions, ces techniques se basent sur l’analyse d’informations statistiques recueillies à partir des requêtes les plus...
متن کاملIntégration de données environnementales : une approche basée sur les entrepôts de documents XML et les ontologies
Résumé. Cet article présente l’approche que nous avons adoptée pour résoudre le problème d’intégration de données dans le contexte du projet SIC-Sénégal dont l‘objectif est de permettre à plusieurs organismes partenaires de partager leurs sources de données environnementales. Nous réalisons une intégration en deux phases. Une première phase d’intégration structurelle, basée sur l’utilisation d’...
متن کاملOptimization of Range Queries through two-level B(UB) Tree Indexing
Résumé— Cet article traite le problème de l’optimisation des requêtes par intervalles, qui jouent un rôle important dans le domaine des bases de données multidimensionnelles (entrepôts de données, Systèmes d’information Géographique). Les techniques classiques teltes que les Grid Files, les R-trees, les R*-trees, ... reposent sur une partition de l’espace de données selon plusieurs axes, ce qui...
متن کاملUne démarche conjointe de fragmentation et de placement dans le cadre des entrepôts de données parallèles
Résumé. Traditionnellement, concevoir un entrepôt de données parallèle consiste d’abord à partitionner son schéma ensuite allouer les fragments générés sur les noeuds d’une machine parallèle. L’inconvénient majeur d’une telle approche est son ignorance de l’interdépendance entre les processus de fragmentation et d’allocation. Une des entrées du problème d’allocation est l’ensemble de fragments ...
متن کامل